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摘要 : [目的 /意义 ] 相对 于 传统 的 信息 


行为 分 析 , 数 据 驱动 的 信息 


150001 


行为 研究 更 注重 数据 的 外 在 性 与 客观 


pee E e 告 果 能 够 更 为 全 面 地 认识 用 户 信息 行为 本 质 特征 。[ 方 法 /过程 ] 通 过 自 APP 实现 对 微 信 


户 分 享 和 阅读 行为 记录 的 采集 ,并 对 微 信 用 户 信 息 行 为 的 时 间 特 性 进行 系统 的 分 析 。 [ 结果 /结论 ] 结果 表 
效应 ,但 是 在 信息 行为 时 间 间 隔 分 布 上 存在 明显 厚 


阵 发 性 ,预示 着 微 信用 户 信息 行为 具有 较 高 的 复 

Eis 2n 的 影响 。 
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信息 行为 ”复杂 性 ”时间 特 征 


杂 性 和 不 确定 性 ,无 法 对 其 产生 过 程 实现 有 效 的 预测 ;此 外 , 微 
信用 户 所 分 享 的 内 容 具 有 很 强 的 时 效 性 ,多 数 内 容 在 微 信 中 能 够 得 到 及 时 的 传播 ,但 传播 链 长 度 显著 


受 分 享 内 


社交 网 络 是 集 交 互 性 .即时 性 和 传播 多 样 性 为 一 
体 的 在 线 服 务 平台 ,已 成 为 众多 用 户 满 足 信息 、 娱 乐 、 
人 揪 关 系 等 方面 需求 的 网 络 聚集 地 ,其 复杂 的 信息 行 
MRAKA HKALE KE 政治 经济 .社会 的 稳定 
FIATA H ERU 。 微 信 作 为 典型 的 即时 通信 类 
社 多 服务 平台 ,其 使 用 率 已 经 连续 多 年 位 居 社 交 类 应 
用 的 榜首 。 截止 到 2018 年 9 月 微 信 全 球 月 活用 户 达 
540.8 亿 , 用 户 日 发 送信 息 超过 了 450 亿 次 ,日 发 送 
音 视 频 通话 达到 了 4.1 亿 次 。 庞 大 的 用 户 群 体 、 多 元 
化 的 交互 方式 和 活跃 的 社交 关系 ,使 微 信 成 为 众多 学 
者 的 研究 重点 5。 如 C. Gan 采用 PLS-SEM 模型 
对 215 份 来 自 微 信 用 户 的 在 线 调 查 数据 进行 了 评估 ， 
人 研究 表明 享乐 满足 ` 社 会 支持 和 信息 搜集 均 会 对 用 户 
的 点 移行 为 产生 积极 的 影响 ; 李 嘉 等 ”通过 问卷 调查 
发 现 功 用 满足 ` 社 交 满 足 和 享乐 满足 对 微 信 用 户 的 持 

续 使 用 意愿 有 着 显著 的 正 向 影响 ; 李 力 和 丁 宁 中 则 从 
移动 社交 类 应 用 的 生命 周期 出 发 ,系统 地 梳理 了 以 微 


=> 


进展 。 
对 人 类 信 ， 
域 之 一 。 


言 \ 微 博 为 代表 的 移动 社交 平台 用 户 信息 行为 的 研究 


息 行 为 研究 是 情报 学 关注 的 主要 研究 领 


早期 的 研究 主要 关注 受众 的 阅读 行为 规律 以 


及 对 文献 的 检索 和 使 用 ” ,其 目的 在 于 优化 信息 管理 


过 程 。 在 一 般 情况 下 ,信息 


行为 的 研究 范畴 包括 了 用 


户 在 信息 需求 和 动机 基础 上 从 事 的 需求 认识 与 表达 、 


信息 查寻 、 信 息 选 择 .信息 存储 、 信 ， 
信息 加 工 、 信 息 交 互 等 活动 "|。 


息 吸 收 与 利用 以 及 
随 着 社会 的 发 展 和 新 


型 信息 技术 的 广泛 应 用 ， 


言 息 行为 的 研究 内 容 也 在 不 断 地 变化 ”。 
索引 敬 和 社交 网 络 的 广泛 应 用 ， 


言 息 传 播 媒介 的 改变 ,对 人 类 


特别 是 搜 
行为 的 定 


为 用 户 信 息 


量 分 析 提 供 了 大 量 的 鲜 活 数据 ,摆脱 了 原 有 研究 中 数 


据 来 源 的 限制 。 


近年 来 , 利 
以 数据 驱动 为 代表 的 用 户 信 


用 用 户 网 络 行为 日 志 数据 、 
息 行为 研究 成 为 了 一 个 重 


点 , 它 可 以 更 为 客观 .系统 地 描述 用 户 信息 行为 特征 和 


fi S dg, 


EXER P t Gov d ipn 
R1! ,行为 习惯 (9 等 给 出 定量 


BEES 
化 的 分 析 , 从 而 为 信息 
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系统 构建 精准 化 个 性 化 的 信息 检索 与 推荐 服务 提供 
帮助 。 

以 数据 驱动 的 人 类 信息 行为 统计 特征 研究 始 于 
2005 年 美国 东北 大 学 A. L. Barabási JZ Xp Ade 
3 188 位 用 户 收发 电子 邮件 的 数据 分 析 , 研 究 表明 用 户 
行为 在 时 间 分 布 上 存在 对 泊 松 过 程 的 偏离 ,而 这 是 传 
ne 
$8 ^ 网 页 浏览 “网络 音乐 下 载 ” 社区 互动 ”等 


的 用 户 数量 和 海量 的 用 户 行为 数据 也 给 社交 网 络 带 来 
了 无 限 的 商机 。 如 Facebook 在 共享 的 技术 架构 基础 上 
对 数据 传输 ,存储 和 数据 处 理 系 统 进行 优化 ,新 浪 微 博 
也 采用 相似 的 技术 架构 并 开放 了 API 接口 满足 了 移动 
终端 用 户 多 元 化 的 产品 需求 。 虽 然 微 信也 为 公众 平台 
开发 提供 技术 支持 ,但 是 作为 典型 熟人 社交 工具 , 微 信 
更 加 注重 用 户 的 私密 性 和 信息 传递 的 准确 性 ,从 产品 
设计 上 就 限制 了 数据 的 开放 程度 ,使 之 难以 实现 对 微 


行为 研究 中 均 发 现 有 类 似 的 非 泊 松 特征 ,表明 用 户 信 
息 行为 在 时 空 分 布 上 非 均 匀 \ 不 稳定 可 能 是 一 种 普遍 
存在 的 现象 。 为 此 ,K. I. Goh 4I A. L. Baraasi 对 用 户 
在 时 空 方面 表现 出 的 异常 行为 提供 了 检测 方法 *1。 
这 种 通过 人 类 动力 学 揭示 用 户 日 常 的 信息 应 用 模式 ， 
看 同 于 传统 的 定性 或 半 定 量化 分 析 , 而 是 通过 无 干扰 
的 客观 数据 ,从 一 个 外 在 观察 者 视角 给 出 分 析 结 果 ,其 
杀手 的 是 “观察 - 数据 获取 与 分 析 - 统计 规律 挖掘 - 
建 和 省 再 现 数 据 规律 "的 过 程 呈 | 。 

弓 综 上 所 述 ,信息 行为 的 研究 范畴 十 分 广泛 ,涉及 到 
从 信息 需求 认识 与 表达 查寻、 选择 ,存储 加工 到 用 户 
恒 妥 互 等 全 过 程 ;对 用 户 信息 行为 的 研究 方法 从 定性 
或 淖 定 量 的 描述 逐渐 转移 到 以 数据 驱动 的 信 ! 息 行为 挖 
MEO apa e 息 行为 研究 不 同 于 传统 的 研究 ,其 
巩 多 地 是 关注 于 用 户 行为 与 各 类 信息 系统 平台 及 信息 
本 演 自 然 交互 过 程 中 入 妇 下 来 的 行为 轨迹 ,数据 是 外 在 
y ENAERE ENY, RET ERE A UR EE 


信 普 通用 户 行为 信息 的 大 数据 采集 。 为 此 ,笔者 开发 
了 APP“ 在 工大 ”(@ HIT) ,并 在 APP 文章 中 植 人 阅读 
日 志 跟 踪 程 序 , 使 用 者 将 APP. 内 文章 分 享 到 微 信和 朋友 
圈 \ 微 信 好 友 、 微 信和 群 后 ,该 文章 的 阅读 和 再 次 分 享 的 
日 志 将 被 记录 在 服务 器 中 ,跟踪 程序 将 记录 分 享用 户 
ID ,阅读 用 户 ID 分享 时 间 阅读 时 间 、 分 享 场景 ,文章 
ID .文章 主题 .主题 类 别 ,由 此 实现 对 每 一 个 用 户 分 享 、 
阅读 日 志 的 采集 。 

从 2015 年 8 月 31 日 到 2018 年 1 月 5 日 ,笔者 通 
过 上 述 采 集 方式 共 获 取 了 247 711 条 微 信 用 户 分 享 数 
据 , 涉 及 200 023 位 微 信用 户 , 采 集 文章 总 数 为 2 128 
篇 。 为 了 保障 用 户 的 个 人 隐私 ,所 采集 的 数据 均 进 行 
了 脐 敏 处 理 ,而 且 采 集 的 数据 仅 作 为 科学 研究 使 用 ,不 
作为 任何 商业 用 途 。 分 享 者 ID 和 阅读 者 ID 分 别 为 数 
据 脱 敏 后 重新 编号 ;数据 来 源 表 示 分 享 文章 的 来 源 , 包 
括 移动 终端 (APP) 、 网 页 (Device ) 微 信 (WX) ;阅读 类 
型 (to_type) 专 指 文章 被 分 享 到 微 信 中 ,并 被 微 信 用 户 


息 行为 ,了 解 用 户 信 息 行为 特征 和 习惯 ,为 揭示 
奖 信 息 行为 的 复杂 性 提供 了 新 的 研究 思路 和 实施 途 
2O .然而 由 于 微 信 不 提供 开放 的 数据 接口 ,无 法 获取 
微 信 个 体 用 户 的 行为 信息 , 现 有 的 研究 多 以 访谈 和 发 
放 问 卷 形式 了 解 微 信用 户 的 行为 特征 与 规律 以 及 影响 
因素 ~“ 。 但 是 采用 访谈 和 问卷 调查 具有 很 大 的 局 
限 性 ,一 是 难以 对 用 户 行为 时 空 分 布 特征 给 予 客观 准 
确 的 描述 ;二 是 无 法 对 用 户 行为 关联 度 以 及 用 户 间 信 
息 分 享 轨迹 给 予 量化 分 析 , 这 些 都 极 大 地 限制 了 对 微 
信用 户 信息 行为 的 研究 。 为 此 ,笔者 通过 自行 构建 的 
移动 APP 平台 采集 、 分 析 微 信用 户 信 息 行 为 记录 , 既 
可 以 发 现 用 户 个 体 行为 统计 特征 ,也 可 将 孤立 的 个 体 
相互 关联 起 来 ,分 析 用 户 间 信息 分 享 轨 迹 ,从 而 实现 宏 
观 趋 势 的 预测 。 


2 ”数据 获取 与 处 理 


交流 .关注 新 闻 热点 、 获 取 感 兴趣 的 内 容 和 分 
是 人 们 使 用 社交 网 络 的 主要 目的 。 而 快速 增长 


沟通 
享 信息 是 


阅读 ;分 享 时 间 (share time) 和 阅读 时 间 (time stamp ) 
分 别 用 时 间 戳 形式 标注 ;分 享 场景 是 指 用 户 分 享 的 微 
信 去 向 ,包括 好 友 消 息 (singlemessage) 朋友 圈 (time- 
line) 微 信 群 聊 ( groupmessage) ;文章 ID 是 分 享 文章 的 
唯一 标记 ,文章 主题 (tite) 是 指 分 享 者 提供 的 文章 标 
题 ,主题 类 别 ( subscribe_name) 是 指 被 分 享 文章 的 出 
处 。 具 体 见 图 1。 


行为 时 间 特 性 分 析 


3 微 信 用 户 信息 fT 
人 类 行为 时 间 特 性 关注 的 是 人 多 次 从 事 某 一 特定 


事件 在 时 间 轴 上 所 表现 出 来 的 统计 规律 。 笔 者 将 从 两 
个 方面 分 析 微 信用 户 信息 行为 的 时 间 特 性 :一 是 微 信 
用 户 日 常 信息 行为 时 间 分 布 ;二 是 微 信用 户 连续 信息 
行为 间隔 时 间 分 布 。 
3.1 用 户 日 常 信息 行为 时 间 分 布 

微 信用 户 日 常 信息 行为 包括 分 享 行为 (share) 、 阅 
读 行为 (stamp ) 和 转发 行为 (reshare) 。 笔 者 将 对 微 信 
用 户 上 述 3 种 行为 的 时 间 特 征 进行 分 析 , 其 中 :分 享 时 
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1 jid from id to id from type to type share time 
2 | 66329 oRAnzt5X- oRAnzt6pj: wx wx 1445693616 
3 | 66330 oRAnzt7NBxoRAnzt, VOEwx wx 1445694658 
4 | 66331 oRAnztóowq: oRAnzt6eF1 wx "x 1445688187 
5 | 66332 oRAnzt9zeioRAnzt22-1wx wx 1445694276 
6 | 66333 oRAnztl-v:oRAnzt6TX wx wx 1445694946 
7 | 66334 oRAnzt3MPEoRAnzt7 vlwx wx 1445694409 
8 | 66335 oRAnzt9Kcl oRAnzt1Gc: wx wx 1445694854 
9 | 66336 oRAnzt-0Z! oRAnzt8Tb: wx wx 1445683213 
10 | 66337 oRAnzt2IZ: oRAnzt8eat wx wx 1445693804 
11| 66338 oRAnzt2£f8; oRAnzt9oPs wx vx 1445695152 
12| 66339 oRAnzt300: oRAnzt14z; wx wx 1445693529 
13 | 66340 oRAnzt8Fv. oRAnzt6hn: wx wx 1445694295 
14| 66341 oRAnzt4EDCoRAnzt2rlMwx wx 1445694424 
15 | 66342 oRAnzt_aFcoRAnztx2Yt wx wx 1445694286 
16 | 66343 oRAnztOnHE oRAnzt 4Rmc wx wx 1445694310 
17 | 66344 oRAnzt3Iy: oRAnzt9D8: wx wx 1445688555 
18| 66345 oRAnzt47ul oRAnzt8ID wx wx 1445689063 
19 | 66346 oRAnzt6Xit oRAnzt 4Kb( wx wx 1445681900 
20 | 66347 oRAnztOnHE oRAnztOnS' wx wx 1445694310 
21 | 66348 oRAnztxv-EoRAnztOndcwx wx 1445694816 
22 | 66349 oRAnzt3MPEoRAnztxdn: wx wx 1445694409 
23 | 66350 oRAnzt8Lc( oRAnztOdh: wx wx 1445692661 
24 | 66351 oRAnzt-Vci oRAnzt9GH: wx wx 1445694702 
25 | 66352 oRAnztOnHE oRAnztOT tt wx wx 1445694310 
26 | 66353 oRAnzt9uLioRAnztorr-wx wx 1445076376 
vm E278 66354 oRAnzt7NBxoRAnztxp cwx wx 1445694658 
> 28 | 66355 oRAnzt-1SioRAnzto4dRE wx wx 1445692805 
29 66356 oRAnztxv-FoRAnzt2dliwx wx 1445694816 
66357 oRAnzt4EDC oRAnzt8w-ewx wx 1445694424 


© 
闻 是 指 用 户 通过 移动 或 固定 终端 从 APP、 网 页 或 微 信 
取 相关 文章 并 将 其 转发 到 微 信 好 友 .朋友 圈 或 微 
信 让 中 的 时 间 ; 阅 读 时 间 是 指 用 户 通过 微 信 好 友 .朋友 
图 着 微 信 群 中 阅读 文章 的 时 间 ; 转 发 时 间 是 指 用 户 通 
过 向 信和 好 友 .朋友 圈 或 征 信 群 中 阅读 文章 后 再 次 转发 
的 对 间 。 
:三 首先 对 微 信用 户 日 常 使 用 习惯 进行 分 析 。 由 于 数 


time_stamp 


article_id link_type title subscribe_name 
1445695186 12839 singlemes: 黑龙江 省 伊 春 市 第 招聘 
1445695186 12839 timeline 黑龙 江 省 伊 春 市 第 招聘 
1445695187 12839 timeline 黑龙 江 省 伊 春 市 第 招聘 
1445695190 12839 timeline 黑龙 江 省 伊 春 市 第 招聘 
1445695190 12839 timeline 黑龙 江 省 伊 春 市 第 招聘 
1445695191 12839 timeline 黑龙 江 省 伊 春 市 第 招聘 
1445695201 12839 timeline 黑龙 江 省 伊 春 市 第 招聘 
1445695210 12839 timeline 黑龙 江 省 伊 春 市 第 招聘 
1445695211 12839 timeline 黑龙 江 省 伊 春 市 第 招聘 
1445695211 12839 groupmessc 黑龙江 省 伊 春 市 第 招聘 
1445695215 12839 groupness: 黑龙 江 省 伊 春 市 第 招聘 
1445695221 12839 timeline 黑龙 江 省 伊 春 市 第 招聘 
1445695228 12839 timeline 黑龙 江 省 伊 春 市 第 招聘 
1445695231 12839 timeline 黑龙 江 省 伊 春 市 第 招聘 
1445695235 12839 timeline 黑龙 江 省 伊 春 市 第 招聘 
1445695260 12839 timeline 黑龙 江 省 伊 春 市 第 招聘 
1445695263 12839 timeline 黑龙 江 省 伊 春 市 第 招聘 
1445695267 12839 timeline 黑龙 江 省 伊 春 市 第 招聘 
1445695278 12839 timeline 黑龙 江 省 伊 春 市 第 招聘 
1445695280 12839 timeline 黑龙 江 省 伊 春 市 第 招聘 
1445695280 12839 timeline 黑龙 江 省 伊 春 市 第 招聘 
1445695291 12839 timeline 黑龙 江 省 伊 春 市 第 招聘 
1445695292 12839 groupmess: 黑龙江 省 伊 春 市 第 招聘 
1445695296 12839 timeline 黑龙 江 省 伊 春 市 第 招聘 
1445695303 12839 timeline 黑龙 江 省 伊 春 市 第 招聘 
1445695304 12839 timeline 黑龙 江 省 伊 春 市 第 招聘 
1445695307 12839 timeline 黑龙 江 省 伊 春 市 第 招聘 
1445695308 12839 timeline 黑龙 江 省 伊 春 市 第 招聘 
1445695312 12839 timeline 黑龙 江 省 伊 春 市 第 招聘 


1 所 采集 样本 的 数据 格式 


集 时 间 段 内 ,节假日 微 信用 户 分 享 行为 占 分 享 总 量 的 
46.7% ,阅读 行为 占 阅读 总 量 的 60.6% ,转发 行为 占 总 
量 的 56.3% 。 这 说 明 , 微 信 作 为 一 类 社交 应 用 ,不 仅 
满足 着 日 常用 户 信息 需求 ,而 且 正在 挤占 用 户 整 体 休 
息 时 间 ,表明 用 户 在 对 外 交往 中 对 微 信 的 依赖 度 得 到 
显著 提升 。 但 是 男 一 方面 也 反映 出 , 微 信 过 多 地 占用 
了 用 户 的 休息 时 间 , 对 网 络 的 依赖 势必 将 减少 用 户 现 


间 跨 度 较 大 ,为 确定 每 天 微 信 分 享 行为 .阅读 行为 
和 睹 发 行为 的 时 间 规 律 ,笔者 对 原 时 间 数 据 进行 了 抽 
取 6E 分 别 按照 小 时 和 星期 读 取 记录 。 图 2 标注 了 24 小 
时 位 微 信 用 户 分 享 ,阅读 和 转发 行为 的 时 间 分 布 。 从 
微 信用 户 日 常 使 用 时 间 上 看 ,用 户 的 活跃 度 共 经 历 两 
次 高 峰 和 一 次 低谷 :从 早晨 4 点 起 , 微 信用 户 使 用 量 开 
始 上 升 ,到 上 午 9 点 - 10 点 达到 高 峰 ,随后 在 10 点 - 
11 点 出 现 小 幅 下 滑 , 在 12 点 午休 时 间 有 所 回升 ,其 后 
3 个 小 时 内 有 所 下 滑 , 下 午 15 点 之 后 微 信 用 户 使 用 量 
平 组 上升, 在 晚上 22 点 左右 出 现 全 天 另 一 次 使 用 高 
峰 ,此 后 开始 快速 下 滑 ,在 凌晨 3 点 左右 出 现 最 低 点 。 
从 微 信用 户 日 常 使 用 时 间 分 布 来 看 , 微 信用 户 的 使 用 
高 峰 不 再 局 限于 休息 时 间 , 在 用 户 处 于 工作 或 学 习 状 
态 下 , 微 信 的 使 用 量 不 降 反 升 ,说 明 微 信 已 经 深 深 地 介 
入 到 用 户 日 常 工作 和 学 习 中 。 再 者 , 微 信用 户 活跃 度 
会 在 节假日 明显 提升 ,表明 微 信 的 使 用 存在 显著 的 周 
未 效应 。 如 图 3 所 示 , 周 六 和 周 日 微 信用 户 使 用 量 明 
显 高 于 日 常 工作 时 间 用 户 的 使 用 量 , 而 在 整个 样本 采 
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实 人 际 互动 的 时 间 和 机 会 ,导致 用 户 人 际 交往 能 力 的 
下 降 和 情感 的 缺失 。 


8.0 


AA 分 享 时 间 
yy 阅读 时 间 
OO 转化 时 间 


6.0 


Device Wechat 


Source 


0 ° 
012345267 8 910111213141516 17 18 19 2021 2223 
Time 

图 2 微 信用 户 日 常 使 用 时 间 分 布 


3.2 用户 连续 信息 行为 时 间 间 隔 分 布 
长 久 以 来 ,对 人 类 行为 时 间 特 征 的 研究 多 停留 在 
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KAF, ILA, YER, 等 . 数据 驱动 的 微 信用 户 信息 行为 时 间 特 征 研究 []. 图 书 情报 工作 ,2019,63(20):103 - 111. 


AA 分 享 时 间 
veo 阅读 时 间 
O-O 转发 时 间 
weekday 
T™ + x 
> 图 3 微 信用 户 周末 效应 


v—— — 
措 数 间隔 的 计数 过 程 ,因此 ,两 次 连续 活动 的 间隔 时 间 
是 通 似 均匀 的 ,长 时 间 内 或 短 时 间 内 同类 行为 密集 出 
现 的 概率 几乎 为 0。 然 而 ,最 近 几 年 的 研究 显示 ,包括 
2 uc 
对 泊 松 过 程 的 偏离 ，-” ,而 最 为 典型 的 非 泊 松 过 
种 是 行 为 时 间 序 列 存在 阵 发 性 和 记忆 性 。 笔 者 根据 样 
术 让 每 一 位 用 户 行为 发 生 时 间 构 建 用 户 行为 时 间 序 
列 荔 析 用 户 连续 信息 行为 的 时 间 间 隔 分 布 特征 ,以 及 
代 伍 息 源 首次 分 享 后 所 经 历 的 阅读 、 转 发 过 程 的 时 间 
间 幅 ,判断 信息 在 微 信 中 的 时 效 性 。 
-三 首先 ,计算 微 信用 户 连 续 信息 行为 的 时 间 间 隔 分 
布 C 状 依 此 判断 统计 区 间 内 微 信 用 户 信息 行为 是 否 存 
在 阵 发 性 和 记忆 性 。 其 中 , 阵 发 性 是 指 将 用 户 行为 作 
为 一 个 事件 ,其 发 生 频 率 是 不 均匀 的 ,有 时 候 很 多 事件 
会 在 较 短 的 时 间 内 集中 发 生 ,而 有 时 候 事件 发 生 的 间 


.0 1.0 2.0 30 40 
logít) 
Ca) 信息 行为 时 间 间 隔 分 布 〈 插图 为 累积 分 布 ) 


隔 期 又 会 很 长 ;如 果 在 一 个 行为 发 生 的 时 间 序 列 中 ,长 
的 时 间 间 隔 后 面 也 是 长 的 时 间 间 隔 , 或 短 的 时 间 间 隔 
后 面 跟着 一 个 短 的 时 间 间 隔 , 则 认为 该 时 间 间 隔 序 列 
存在 记忆 性 。 对 于 人 类 行为 活动 中 表现 出 来 的 阵 发 性 
和 记忆 性 ,一 般 可 采用 K. L Goh 和 A. Barabási 提出 
的 异常 行为 检测 指标 进行 分 析 ” 。 阵 发 性 检测 系数 
为 B= 让 地 "关注 于 时 间 间 隔 序 列 标准 差 o, 和 均值 
m, 的 统计 ,Be ( -1.1)。 如 果 B>0 表明 该 时 间 序 列 
具有 阵 发 效应 ,而 且 B 越 接 近 1, 则 时 间 间 隔 分 布 越 不 
均匀 , 阵 发 效应 越 强 ;有 8 =0 表示 时 间 序 列 满足 泊 松 分 
布 ,均值 与 标准 差 相 等 ,是 一 个 无 倾向 的 序列 。 

如 图 4(a) 所 示 , 从 总 体 上 看 , 微 信用 户 信息 行为 
发 间隔 时 间 分 布 存在 明显 偏离 指数 分 布 的 厚 尾 现象 ， 
其 分 布 曲线 P(t) =1. 004x R = -.964 ,曲线 符合 
宕 律 分 布 , 显 示 行 为 产生 时 间 间 隔 整体 呈现 极度 不 均 
匀 ,多 数 行为 发 生 的 时 间 间 隔 较 为 短 (2 分 钟 之 内 ) , 约 
占 行 为 发 生 总 数 的 83. 7896 ,但 是 也 有 少 部 分 信息 行 
为 发 生 的 时 间 间 隔 较 长 ,时 间 间 隔 超过 1 个 小 时 约 占 
行为 发 生 总 数 的 0.58% ,而 最 长 时 间 间 隔 高 达 5 826 
分 钟 。 从 用 户 个 体 和 角度 ,用户 个 体 信 息 行为 发 生 次 数 
也 是 极度 不 均衡 的 ,如 图 4(b) 所 示 , 样 本 期 间 内 用 户 
个 体 信 息 行为 发 生 次 数 超过 50 次 的 仅 有 10 位 用 户 ， 
84.3196 用 户 统计 期 内 信息 行为 次 数 仅 为 1 次 ,最 多 行 
为 发 生 数 为 573 次 。 无 论 是 从 信息 行为 的 间隔 时 间 分 
布 ,还 是 从 用 户 个 体 信息 行为 的 发 生 次 数 来 看 , 均 呈 现 
与 泊 松 分 布 的 钟 型 曲线 完全 不 同 的 厚 尾 形态 ,表明 微 
信用 户 在 小 范围 内 (有 限 的 参与 个 体 和 有 限 的 间隔 时 
间 ) 存 在 高 频 信息 活动 ,而 这 些 高 频 信息 活动 对 于 促进 
信息 传播 和 提高 传播 效率 起 到 了 关键 作用 ,是 微 信 日 
常 管理 中 需要 着 重 关 注 的 。 


i 11 21 3 573 
信息 行为 次 数 
(b) 用 户 信息 行为 发 生 频率 ( 插图 为 频率 分 布 ) 


4 微 信用 户 连续 信息 行为 时 间 间 隔 
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图 二 情报 三 作 


$8 63 35 $820 Hg 2019 年 10 月 


图 5 列 示 了 从 样本 采集 期 第 1 分 钟 到 样本 采集 第 
100 小 时 内 不 同时 间 粒 度 下 用 户 信息 行为 的 发 生 密 
度 。 以 小 时 作为 间隔 时 间 标 注 为 例 ,从 样本 采集 期 开 
始 1 小 时 内 发 生 了 一 次 信息 行为 ,此 后 经 过 了 近 24 小 
时 的 静默 期 ,在 间隔 时 间 为 25 小 时 和 26 小 时 内 连续 
发 生 了 两 次 信息 行为 ,然后 进入 7 个 小 时 的 静默 期 ,在 
间隔 时 间 为 34 小 时 .35 小 时 和 36 小 时 内 连续 发 生 了 
3 次 信息 行为 ,此 后 在 经 历 一 个 漫长 的 空 档期 后 进入 
行为 发 生 的 密集 期 。 从 总 体 上 看 ,大 部 分 行为 发 生 间 
隔 时 间 和 其 平均 值 之 间 差 异 较 大 ,以 分 钟 为 单位 , 微 信 
用 户 信息 行为 发 生 的 间隔 时 间 分 布 的 标准 差 e, 为 
145.39 ,平均 值 m, IN 5. 32, 阵 发 系数 B =0. 929 , E 
近 1, 表 明 微 信用 户 信息 行为 序列 极 不 均衡 ,存在 很 强 
的 阵 发 性 。 从 分 享 场景 上 看 ( 见 表 1) ,在 较 小 的 时 间 
粒度 下 ,朋友 圈 (timeline) 和 微 信 群 聊 ( groupmessage ) 
中 者 户 信息 行为 的 阵 发 系数 要 高 于 好 友 消息 sin- 
message) ,而 随 着 时 间 粒 度 的 增 大 , 阵 发 系数 有 减弱 
趋 盈 ,特别 是 在 朋友 圈 (timeline) 中 表现 的 更 为 显著 。 


100 200 


5 不 同时 间 粒 度 下 信息 行为 发 生 间隔 


R1 不 同 场景 和 时 间 粒 度 下 信息 行为 阵 发 性 检测 


类 型 时 间 粒 度 平均 值 标准 差 阵 发 系数 

Timeline 1 minute 6.76 238.39 0.94 
10 minute 1.57 23.83 0.88 

30 minute 1.19 7.94 0.74 

60 minute 1.09 3.96 0.57 

Groupmessage 1 minute 35.59 928.16 0.93 
10 minute 4.43 92. 80 0.91 

30 minute 2,43 30. 93 0.87 

60 minute 1.55 15.45 0.82 

Singlemessage 1 minute 84.57 1 485.15 0. 89 
10 minute 9.20 148.50 0.88 

30 minute 3.66 49. 49 0. 86 

60 minute 2.28 24.73 0. 83 


记忆 性 则 关注 于 连续 两 组 行为 时 间 序 列 之 间 的 关 
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联 关系 ,K. L Goh 和 A. Barabási 在 文献 ”中 提出 了 
记忆 相关 系数 机 = 二 一 一下 ,其 中 
n, 是 第 7 个 用 户 行为 时 间 间 隔 序 列 的 数目 ,m, 和 m, 
是 计算 过 程 所 抽取 的 两 个 样本 ~ 和 ,的 平均 值 ,oo 
和 a, 是 与 之 对 应 的 标准 差 ,如 果 必 值 为 正 , 则 时 间 序 
列 具 有 记忆 效应 ,WM 值 为 负 则 为 反 记忆 效应 。 按 照 记 
忆 相 关系 数 的 定义 ,需要 对 每 位 用 户 分 享 行为 时 间 序 
列 进行 分 组 ,而 每 组 n 个 元 素 则 意味 着 需要 有 n, +1 
个 分 享 行为 产生 。 如 果 选 择 每 组 抽取 样本 序列 数目 过 
少 , 则 很 难保 证 用 户 行为 的 连贯 性 。 为 此 笔者 选取 信 
息 行 为 频率 较 高 的 前 50 位 用 户 作为 样本 ,样本 用 户 信 
息 行为 发 生 数 最 高 为 573 次 ,最 低 为 19 次。 经 计算 ， 
样本 用 户 记 忆 相 关系 数 MM 最 高 值 为 0.14 ,最低 值 为 - 
0.13, FI M = -0.03 ,近似 等 于 0 ,表明 在 统计 期 内 多 
数 样 本 个 体 行为 不 存在 记忆 效应 。 如 图 6 所 示 , 图 中 
每 个 点 代表 满足 条 件 样本 个 体 , 除 1 个 用 户 信息 行为 
次 数 超过 500 次 之 外 ,样本 用 户 信 息 行为 次 数 都 在 100 
次 以 下 ;样本 用 户 记忆 系数 基本 上 围绕 0 值 成 对 称 分 
布 ,而 样本 用 户 阵 发 性 系数 均 大 于 0, 均值 等 于 0.4。 
表明 在 样本 统计 期 内 ,高 频 微 信用 户 的 信息 行为 在 时 
间 间 隔 分 布 上 存在 显著 的 阵 发 性 ,但 不 存在 记忆 效应 。 


VLERK ”十 阵 发 性 系数 
OEREO 阵 发 性 系数 平均 值 
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6 ”高 频 用 户 行为 时 间 间 隔 特 性 检测 


微 信 中 的 信息 传播 是 依托 人 际 关系 链 带 动 的 信息 
传播 链 ,信息 只 有 通过 用 户 层 层 分 享 和 转发 才能 产生 
传播 效果 。 分 析 微 信用 户 之 间 的 分 享 与 阅读 阅读 与 
转发 行为 之 间 时 间 间 隔 , 将 有 助 于 了 解 微 信 中 信息 传 
播 的 时 效 性 。 通 常情 况 下 ,信息 从 信息 源 发 送 后 信息 
经 历 的 分 享 ,阅读 的 时 间 间 陋 越 短 , 则 信息 被 采纳 的 越 
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及 时 ,信息 的 时 效 性 越 强 ;而 信息 传播 链条 越 长 , 则 反 
映 信息 被 转发 的 层级 越 多 ,信息 有 效 到 达 率 和 用 户 的 
参与 深度 都 得 到 了 强化 。 笔 者 将 信息 的 时 效 性 定义 为 
C= 二 了 ,其 中 届 表 示 针对 第 上 篇 文章 用 户 i 与 用 


izj 


户 j 之 间 阅 读 与 分 享 的 时 间 间 隔 ,wi 表示 第 大 篇 文章 


为 13.44% ;而 从 分 享 到 被 阅读 间隔 时 间 超 过 24 小 时 
的 约 占 文章 总 数 的 6. 06% ;文章 的 平均 时 效 性 集中 在 
1 -120 分 钟 区 间 内 , 约 占 文 章 总 数 的 62.5% 。 分 享 与 
阅读 的 平均 间隔 时 间 反 映 的 各 篇 文章 总 体 的 时 效 性 ， 
但 是 受 微 信 用 户 使 用 习惯 和 主题 偏好 的 影响 ,每 位 用 
户 对 文章 利用 程度 是 存在 很 大 差异 的 ,由 此 导致 每 篇 


被 阅读 的 次 数 , 则 平均 时 效 性 为 C' T S Q0) ; 信 
息 的 传播 链 长 度 可 以 定义 为 D, = mard, HH dj des 
针对 第 篇 文章 所 构建 的 传播 链 中 任意 两 个 用 户 i 与 j 
之 间 测 地 线 长 度 , 则 平均 传播 链 长 度 D' - S Die 


[1,n] ,n=2128, 

微 信和 是 典型 的 即时 类 通信 工具 ,实现 两 人 或 多 人 
2 机 的 高 效 沟通 是 人 们 使 用 微 信 的 主要 目的 ,分 享 与 
阅 寻 之 间 的 时 间 间隔 能 够 准确 地 反映 信息 在 微 信 中 的 
EEA MET 所 示 , 各 篇 文章 分 享 与 阅读 之 间 


的 时 间 间 隔 分 布 是 极 不 均衡 的 :从 每 篇 文章 分 享 与 阅 


话 网 平均 间隔 时 间 上 看 ,在 1 分 钟 之 内 被 阅读 的 比重 
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(a) 文章 分 享 与 阅读 间 平 均 时 间 差 分 布 


文章 分 享 与 阅读 的 间隔 时 间 分 布 极 不 均衡 ,为 了 准确 
地 反映 信息 传播 效率 ,笔者 选择 测量 每 篇 文章 分 享 与 
阅读 间 最 短 时 间 差 ,如 图 7(b) 所 示 , 最 短 时 间 差 在 一 
分 钟 之 内 的 文章 比重 为 37.8% ,30 分 钟 之 内 被 阅读 的 
文章 比重 高 达 81. 95% ,表明 绝 大 多 数 信 息 在 微 信 中 
能 够 得 到 及 时 的 传播 ,而 且 微 信用 户 对 信息 的 传递 和 
利用 的 效率 也 是 比较 高 的 。 这 一 点 从 各 篇 文章 的 传播 
链 长 度 得 以 进一步 验证 ,如 图 8 所 示 ,传播 链 长 度 累 积 
分 布 满 足 指 数 为 2.22 的 短 律 分 布 ,这 意味 着 绝 大 多 数 
文章 被 持续 转发 的 次 数 很 低 , 仅 存在 少数 文章 能 够 得 
到 众多 微 信用 户 持续 关注 和 转发 。 
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(b) 文章 分 享 与 阅读 间 最 短 时 间 差 分 布 


图 7 文章 时 效 性 分 析 


事实 上 也 是 如 此 ,在 总 数 为 2 128 篇 的 文章 中 , 单 
篇 传播 链 最 长 为 51 ,传播 链 最 短 为 1 ,平均 分 享 路 径 长 
度 为 10。 传 播 链 长 度 超过 10 的 仅 占 文章 总 数 的 
0.4796 ,但 却 占 到 信息 行为 总 次 数 的 80. 62% ;而 传播 
链 长 度 为 1 的 文章 占 到 文章 总 数 的 88.44% ,但 却 仅 占 
信息 行为 总 次 数 的 0.36% 。 传 播 链 长 度 反 映 了 用 户 
对 分 享 内 容 的 持续 关注 程度 ,传播 链 越 长 则 表明 该 内 
容 在 微 信 中 被 转发 的 次 数 越 高 , 微 信用 户 的 参与 度 越 
高 。 上 述 结果 意味 着 绝 大 多 数 文章 并 没有 得 到 微 信用 
户 的 普遍 关注 ,也 没有 产生 转发 价值 。 由 于 “在 工大 ” 


(@ HIT) 使 用 者 多 为 在 校 师 生 , 在 微 信 中 分 享 的 文章 
主题 涉及 校园 公告 ,学校 新 闻 、 校 园 招聘 和 兼职 校园 
美食 .旅游 攻略 等 ,在 传播 链 长 度 超过 10 的 14 篇 文章 
中 ,涉及 校园 公告 有 6 篇 ,学 校 新 闻 有 4 篇 ,校园 招聘 
有 4 篇 ,都 是 与 学 生 在 校 学 习 、 生 活 紧 密 相关 的 主题 。 


微 信 作 为 最 具 影响 力 社 交 应 用 ,对 其 使 用 行为 的 
研究 一 直 都 是 研究 的 热点 。 笔 者 以 微 信 作为 研究 对 
象 ,在 技术 路 线 上 ,遵从 人 类 动力 学 “观察 - 数据 获取 
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图 二 情报 三 作 
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8 微 信 中 单 篇 文章 传播 链 长 度 


y 


JSE - 规律 挖掘 与 再 现 "过 程 。 首 先 通过 自行 构建 
的 移动 APP 平台 实现 了 对 微 信用 户 分 享 和 阅读 行为 
RTI AE ,采集 的 数据 包括 时 间 信 息 、 分 享 关系 、 分 
本 而 对 微 信用 户 信 息 行为 的 时 间 特 
性 丽 揭 示 主 要 从 两 个 方面 展开 :对 微 信用 户 日 常 信 
筷 往 为 时 间 分 布 特征 的 分 析 , 研 究 表明 微 信 用 户 日 党 
参 高 峰 不 再 局 限于 休息 时 间 ,而 已 经 深 深 地 介入 到 
二 日 常生 活 和 工作 中 ,并 且 微 信用 户 活跃 度 在 节 候 
印 兴 明显 提升 ,存在 显著 的 假日 效应 。 加 对 微 信 用 户 
信息 行为 间隔 时 间 分 布 特征 的 分 析 , 研 究 表明 微 信 用 
月 深 续 信息 行为 之 间 的 时 间 间 隔 分 布 存在 明显 厚 尾 现 
象 出 很 强 的 阵 发 性 ,并 且 时 间 粒 度 越 小 , 阵 发 性 越 强 ， 
在 微 信 朋 友 圈 中 表现 的 尤为 显著 ;而 通过 对 高 频 用 户 
的 星 续 信息 行为 间 的 关联 性 分 析 表 明 , 统 计 期 内 样本 
用 户 信息 行为 不 存在 显著 的 记忆 效应 ; 微 信 用 户 表现 
的 强 阵 发 性 和 无 记忆 性 特征 ,意味 着 微 信 中 用 户 信 
息 行为 具有 较 高 的 复杂 性 和 不 确定 性 ,对 其 产生 过 程 
很 难 实现 有 效 的 预测 。 此 外 ,通过 文章 时 效 性 分 析 表 
明 , 绝 大 多 数 信息 在 微 信 中 能 够 得 到 及 时 的 传播 ,并 且 
微 信用 户 对 信息 的 传递 和 利用 的 效率 较 高 ,但 是 受 分 
享 内 容 主题 的 影响 ,多 数 内 容 没 有 得 到 用 户 的 持续 关 
注 ,也 没有 产生 转发 价值 
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Temporal Characteristics of Wechat Users’ Information Behavior Based on Data -driven Approach 
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N «Abstract ; | Purpose/ significance | Compared with traditional information behavior approaches, the research on in- 
fofiliation behavior based on the data-driven approach pays more attention to the externality and objectivity of data, and the 
teSiiig results can be more comprehensive understanding of user information behavior characteristics. [ Method/process ] 
This paper realizes the collection of Wechat users’ sharing and reading behavior records through a self -built APP , and sys- 
teratically analyses the temporal characteristics of Wechat users” information behavior. [ Result/conclusion | The results 
show, that the daily information behavior of Wechat users has significant holiday effect, but there are a obvious fat-tail phe- 
nomenon and strong burstiness effect in the time interval distribution of information behavior, which indicate that the infor- 
mátion behavior of Wechat users has high complexity and uncertainty, and can not effectively predict its generating 
prócess ; on the other hand, when the contents shared by Wechat users have very strong time -effectiveness , the most con- 
tem? can be timely disseminated in Wechat, but the length of the dissemination chain is significantly affected by the theme 
of the shared contents. This study provides a reference for revealing the complexity of human information behavior. 


Keywords: Wechat information behavior complexity temporal characteristics 
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